13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론

13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론